Stable Diffusion

Stable Diffusion
Modifica el valor a Wikidata
TipusModel de text a imatge, latent variable model (en) Tradueix i Models de difusió Modifica el valor a Wikidata
Versió inicial22 agost 2022 Modifica el valor a Wikidata
Versió estable
SDXL 1.0 (26 juliol 2023)
0.0.1 (22 juny 2023) Modifica el valor a Wikidata
LlicènciaCreativeML Open RAIL-M (en) Tradueix Modifica el valor a Wikidata
EpònimModels de difusió Modifica el valor a Wikidata
Característiques tècniques
Sistema operatiuLinux, macOS i Microsoft Windows Modifica el valor a Wikidata
Escrit enPython Modifica el valor a Wikidata
Més informació
Lloc webstability.ai… (anglès) Modifica el valor a Wikidata
Id. Subredditstablediffusion Modifica el valor a Wikidata

Stable Diffusion és un model d'aprenentatge profund de text a imatge llançat el 2022. S'utilitza principalment per a generar imatges detallades condicionades a descripcions de text, tot i que també es pot aplicar a altres tasques com ara la restauració d'imatges, repintar i generar traduccions d'imatge a imatge guiades per una entrada de text.[1]

Stable Diffusion és un model de difusió latent, una varietat de xarxes neuronals generatives profundes desenvolupades pel grup CompVis de la LMU de Múnic.[2] El model ha estat llançat per una col·laboració de Stability AI, CompVis LMU i Runway amb el suport d'EleutherAI i LAION. [3][4][5] L'octubre de 2022, Stability AI va recaptar 101 milions de dòlars en una ronda liderada per Lightspeed Ventures i Coatue.[6]

El codi i els pesos del model de Stable Diffusion són públics[7] i es pot executar amb la majoria de maquinari de consum equipat amb una GPU modesta. Això va marcar una diferència dels models propietaris anteriors de text a imatge, com ara DALL-E i Midjourney, als quals només es podia accedir mitjançant serveis al núvol.[8][9]

  1. «Diffuse The Rest - a Hugging Face Space by huggingface». huggingface.co. Arxivat de l'original el 2022-09-05. [Consulta: 5 setembre 2022].
  2. Rombach, Robin; Blattmann, Andreas; Lorenz, Dominik; Esser, Patrick; Ommer, Björn «High-Resolution Image Synthesis with Latent Diffusion Models». arXiv:2112.10752 [cs], 13-04-2022.
  3. Error de citació: Etiqueta <ref> no vàlida; no s'ha proporcionat text per les refs nomenades stable-diffusion-launch
  4. Error de citació: Etiqueta <ref> no vàlida; no s'ha proporcionat text per les refs nomenades stable-diffusion-github
  5. «Revolutionizing image generation by AI: Turning text into images». LMU Munich. [Consulta: 17 setembre 2022].
  6. Wiggers, Kyle. «Stability AI, the startup behind Stable Diffusion, raises $101M» (en anglès). Techcrunch. [Consulta: 17 octubre 2022].
  7. «Stable Diffusion», 27-12-2022. [Consulta: 27 desembre 2022].
  8. «The new killer app: Creating AI art will absolutely crush your PC». PCWorld. Arxivat de l'original el 2022-08-31. [Consulta: 31 agost 2022].
  9. Vincent, James. «Anyone can use this AI art generator — that’s the risk» (en anglès americà), 15-09-2022. [Consulta: 27 desembre 2022].

From Wikipedia, the free encyclopedia · View on Wikipedia

Developed by Tubidy